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Введение 


Принятие решения во многих областях деятельности человека приводит к не- 
обходимости решения задачи классификации (распознавания образов): выявления 
принадлежности некоторого объекта к одной из групп, отличающихся по известному 
признаку. 
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Определение принадлежности объекта к некоторой группе требует анализа боль- 
шого объема информации, часто приводит к сопоставлению противоречивых сведений, 
осложняется невозможностью проведения натурных экспериментов над рядом объектов 
управления. При этом в таких областях, как медицинская диагностика, идентификация 
личности, защита от атак компьютерных вирусов, управление производственными систе- 
мами возникают особые требования к скорости распознавания, так как время на принятие 
решения и его практическое воплощение ограничено. Перечисленные особенности опре- 
деляют необходимость математического моделирования и автоматизации процесса класси- 
фикации объектов управления различной природы. 

Существующие в настоящее время подходы к решению задач классификации 
можно выделить пары принципиально различных групп: 

1) по количеству выделяемых классов: методы бинарной и мультиклассовой 
классификации; 

2) по способу формализации классификатора: классификация с учителем и без 
учителя. 

Бинарная классификация позволяет разделять множество исследуемых объектов 
на два подмножества (класса) [1], [2]. Задачи, требующие выделения более чем двух 
подмножеств, решаются на основе методов мультиклассовой классификации [3], [4]. 

Методы классификации с учителем реализуют формализацию правила разделения 
подмножеств на основе обобщения информации о значениях ряда показателей (дескрип- 
торов) объектов, принадлежность которых к данным подмножествам задана [1], [3], [4]. При 
этом необходима достоверная информация о составе классов и о значениях всех 
входных и выходных параметрах модели по достаточно болыпому множеству объектов, 
которое принято называть обучающей выборкой или группой эталонов. Такие методы 
допускают использование описаний объектов классификации и правил их разделения на 
группы в любой форме: количественной и качественной, непрерывной и дискретной. 
Основная сложность при использовании методов, основанных на обучении, определяет- 
ся сложностью обеспечения репрезентативности обучающей выборки в особенности в 
долгосрочной перспективе. 

Методы второй группы позволяют выявлять среди исследуемых объектов наи- 
более похожие по некоторым показателям. В этом случае классификация выполняется на 
основе вычисления различных расстояний между значениями дескрипторов [5], [6]. 
Природа родства между объектами различных классов остается необъяснимой. Состав 
классов может быть и неизвестен на начальных этапах исследования, однако критерии 
их разделения обязательно должны быть заданы в количественной форме. Преиму- 
ществом методов классификации без учителя является скорость и независимость от 
истории исследуемых объектов. 

Практика управления часто приводит к задачам классификации объектов, для 
которых характерна высокая скорость изменения структуры, поэтому неэффективны 
методы, требующие обучения. Необходимость классификации по критерию, задан- 
ному в неколичественной форме, либо невозможность заранее сформировать полный 
перечень классов приводит к задаче, решение которой на основе существующих ме- 
тодов неэффективно. 

Задача классификации с неизвестным составом алфавита классов и качествен- 
ным критерием их разделения решена автором на примере управления устойчи- 
востью систем, обладающих иерархической структурой. К числу таких систем отно- 
сятся субъекты хозяйствования, компьютерные сети, функциональные системы живых 
организмов в аспекте управления ходом лечения заболеваний и проч. В качестве 
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неколичественного критерия разделения классов выбрано следующее условие: элементы 
различных классов должны принципиально отличаться возможностями и целями уп- 
равления устойчивостью. 

Целю работы — получить метод мультиклассовой классификации систем с иерар- 
хической структурой управления (СИСУ), допускающий использование неколичествен- 
ного описания критериев разделения классов и не требующий априорной информации о 
составе множества классов и о принадлежности к классам ряда реальных объектов. 

Постановка задачи — формализовать правило, разделяющее множество СИСУ 
на п классов В; (1=[..п, где п — количество классов), таких, что элементы каждого 
класса ВБ; отличались от элементов каждого другого класса В, (1=1..п, } = 1) по кри- 
терию 4; - в состав множества Ми управляющих воздействий, необходимых для по- 
вышения устойчивости объекта класса Ь‚, входят элементы, не входящие в множество 
МЬ управляющих воздействий, необходимых для элементов класса Р,. 


Методы исследования 


Выбор методов исследования определяется спецификой исследуемой предметной 
области — управления устойчивостью систем, характеризующихся иерархическими 
взаимосвязями. Данное исследование строится на информации о исправности (надле- 
жащем функционировании) отдельных элементов системы и о используемых при управ- 
лении механизмах. Особенностью указанных показателей является удобство представ- 
ления в двоичной форме (1 — элемент исправен, управляющее воздействие применяется, 
механизм достаточно эффективен, 0 — неисправен, не используется, не эффективен) и как 
следствие возможность применения методов алгебры логики. Иерархические взаимосвязи 
также легко представляются в виде матриц инцидентности, представляемых в двоичной 
форме. 

Двоичная форма показателей, используемых для описания состояния системы, 
определяет выбор методов алгебры логики. К числу существенных преимуществ 
данных методов относится легкая автоматизация и аппаратная реализация, хорошая 
проработанность приемов доказательства и опровержения [2]. 


Результаты исследования 


Разработанный автором метод мультиклассовой классификации предполагает 
последовательное прохождение ряда основных этапов, представленных на рис. 1. 

Первый этап метода предполагает составление описания СИСУ с помощью 
ряда дескрипторов, представляемых в двоичной форме: 

5р = (1,1... „О. 2...О,,ЕМ,ЕМ,..ЕМ,) 

где [,1,.., — показатели исправности 1-й подсистемы (1=1..п, п — количество 
подсистем, учитываемых при моделировании), принимающие значение 1, если под- 
система исправна и 0 - в противном случае; 

р,0....), — показатели активности 1-го механизма управления (1=1..т, т — 
количество управляющих механизмов, учитываемых при моделировании), принима- 
ющий значение 1, если механизм применяется; 0 — если механизм не задействован; 

ЕМ,, ЕМ....ЕМ, — показатели, описывающие требования внешнего регулирования, 
принимающие значение 1, если объект соответствует некоторым нормам внешнего 
регулирования, 0 — в противном случае (индекс 1 определяет возможность рассматри- 
вать К различных аспектов внешнего регулирования). 
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у 
Критерий разделения классов 4, 


множество показателей, характеризующих 
СИСУ 


Отбор обобщенных дескрипторов 56 для описания СИСУ 


У 
Описание всех возможных состояний ЗЬ систем 
у 
Формализация множества запрета 7 
Исключение из множества возможных состояний СИСУ таких 
сочетаний дескрипторов, которые соответствуют области запрета 


Разделение области существования СИСУ на классы в 
соответствии с критерием 4 


Алфавит классов 
соответствует 
требованиям ЛПР 


Да Нет 


у 


Отбор дескрипторов 56’, определяющих отличие классов 
у 
Построение классификатора ОМР (5Ь’) в виде дизъюнктивной 
нормальной формы дескрипторов, определяющих отличие классов 


; 


Формализация правил расчета Т(С) дескрипторов, опрделяющих 
отличие классов 56" 
у 
Классификатор ОМЕ (56'), показатели С для 
оценки 55’, правила Т(С) расчета 55" 


Г 


Рисунок 1 — Графическая схема алгоритма метода классификации без учителя 
на основе неколичественно заданного критерия разделения классов 


На втором этапе выполняется описание всех возможных состояний систем, что 
равнозначно составлению всех возможных сочетаний п+т-+К двоичных признаков. В ре- 
зультате будет получено 2"*"* возможных сочетаний. 

Описание области существования объекта классификации удобно представить в 
форме матрицы 5Ь размерностью (и+т-+®) х(2"*"*^), 

Решение практических задач приводит к составлению матриц большой размерности, 
т.к. адекватное описание большинства СИСУ требует десятков показателей. Количество 
возможных сочетаний достигает нескольких тысяч. 
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Однако значительная часть таких сочетаний невозможна в реальных условиях. 
С целью исключения противоречивых комбинаций предложенный метод предусматри- 
вает анализ взаимосвязей между показателями [, р и ЕМ. Результатом является форма- 
лизация множества запрета 7. — правил, ограничивающих возможные сочетания значений 
дескрипторов [2]. 

Составление множества запрета в общем случае — сложная эвристическая задача, 
требующая детальных знаний о структуре и функционировании объекта классификации. 
С целью упрощения данного этапа метод предполагает последовательный поиск взаимо- 
связей различной природы и формализацию запретов следующих групп: 

1) запреты физических противоречий 77, определяемые физическими законами 
существования и взаимодействия подсистем СИСУ; 

2) запреты иерархии 7” являются следствием иерархических связей между 
подсистемами СИСУ; 

3) запреты рационального управления 7^", описывающие логику управления, 
нацеленного на повышение устойчивости, и применение для этого наиболее эффектив- 
ных средств; 

4) запреты внешнего регулирования 7^^, т.е. ограничения возможностей функцио- 
нирования и управления СИСУ со стороны внешних сил (законодательной системы, 
морально-этических норм, охраны труда и проч..). 

Исключение из множества возможных состояний СИСУ такие сочетания дес- 
крипторов, которые соответствуют области запрета 7, позволяет на один-два порядка 
сократить количество столбцов матрицы 56. 

Полученная в результате матрица 756 содержит полные с точки зрения выбран- 
ной модели СИСУ описания состояний классифицируемых объектов. Сравнение этих 
описаний объединение их в группы, наиболее соответствующие требованиям крите- 
рия 4 позволяет сформировать ряд возможных алфавитов классов. 

Если среди предложенных алфавитов классов нет соответствующего требова- 
ниям лица, принимающего решение (ЛПР), то построение классификатора в рамках 
существующего набора дескрипторов 56 невозможно. Решение поставленной задачи 
в этом случае требует развития модели, используемой для описания состояния СИСУ, и 
повторения всех перечисленных выше этапов построения классификатора на основе 
другого множества показателей 56. 

Если среди составленных алфавитов классов найден хотя бы один, удовлетво- 
ряющий требованиям лица, принимающего решение (ЛПР), то метод предполагает 
выявление среди дескрипторов 5 таких показателей 56’, значения которых позволяют 
идентифицировать объекты различных классов. 

Классификатор в результате представляет собой дизьъюнктивную нормальную 
форму [2] от показателей 5Ь'. 

Классификатор в дизьюнктивной форме может использоваться как для бинарной 
классификации [5], так и для мультиклассовой. В этом случае число «слагаемых» 
должно быть на единицу меньше количества классов и’. Тогда функция-классифи- 
катор сможет принимать значения от 0 до у-1, что достаточно для разделения у 
классов. 

Завершение разработки классификатора требует формализации правил расчета 
обобщенных дескрипторов 56’, используемых при построении классификатора. Данный 
этап необходим, т.к. не всегда показатели 56’, позволяющие оптимально классифици- 
ровать СИСУ, поддаются непосредственному наблюдению. Определение значений 
многих величин требует дополнительных исследований или применения специаль- 
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ных средств измерения, выбор которых в значительной степени определяет качество 
дальнейшей классификации. Для измерения отдельных обобщенных дескрипторов 
необходимо рассчитать или измерять несколько показателей. Результатом является 
множество легко измеримых показателей С, а также правила Т(С), регламентирую- 
щие оценку показателей 56’ по заданным значениям показателей С: 


ТС) = 56'. 


Двухэтапная процедура отбора показателей оправдана, так как применение на 
начальных этапах исследования обобщенных дескрипторов 56’ предоставляет пре- 
имущества «прозрачности» при описании состояния СИСУ и при составлении мно- 
жества запрета, а также позволяет получать более простые классификаторы. На за- 
вершающих этапах исследования необходимы легко измеримые показатели С, с 
целью исключения ошибок оценки входных параметров модели. Составление мно- 
жеств С и Т на последнем этапе разработки модели классификации значительно эко- 
номичнее, так как позволяет работать с показателями 5’, количество которых в не- 
сколько раз меньше, чем 56, используемых на первых этапах. 


Выводы 


Таким образом, в результате проведенных исследований получен метод класси- 
фикации, обладающий следующими особенностями: 

1) не требует предварительного обучения на эталонной выборке, что сущест- 
венно сокращает время разработки модели классификации и исключает влияние ошибки 
репрезентативности обучающей выборки; 

2) позволяет разделять классифицируемое множество на два и более подмножеств. 
Количество возможных классов определяется количеством непротиворечивых 
сочетаний значений двоичных показателей, используемых для описания состояния 
СИСУ; 

3) учитывает ограничения определяемые иерархией подсистем объекта класси- 
фикации, физическими законами его функционирования, логикой рационального уп- 
равления и нормами внешнего регулирования; 

4) позволяет разделять объекты не произвольным случайным образом, а в соот- 
ветствии с заданным критерием классификации; 

5) позволяет использовать критерии разделения классов, заданные в произволь- 
ном виде, и при этом не требует упрощения задачи с целью приведения критерия к 
количественной форме; 

6) позволяет получать классификатор в дизъюнктивной нормальной форме, что 
раскрывает широкие возможности автоматизированной и аппаратной реализации 
предложенного метода классификации. 

В результате полученный метод предоставляет возможности решения задач, в 
равной степени недоступных для классических методов классификации с учителем и 
без учителя — задач с неполной информацией о составе классов, содержащих кач- 
ественные критерии разделения классов. 
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№.М№. Мазаййта 
Гре Сшеготзаноп Мейоа уийои! Геатитя Вазеа 


оп ОиашШануе С1а55 Опляюоп Стиепа 

ТБе гези$ оЁ зоуше Фе ргоМет оЁ саегоптайноп Базе оп дааШайуе с1аз$ 4%1$10й 
сщепа аге ргезещеа. 'ТВе деуе]оре тешо4 аПо\з ю гесостте тоге фап №0 с1а$$е$. 

Тре тефо4 1$ Базед оп Фе ргобывоп епзетЫе апа[уз15.  аПо\з ю гедисе а аптеп- 
$1опашу оЁ ап оБес( ех1$епсе агеа апа © ипие обес ш этоирз АШег Бу а хлуеп сщепоп. 
Аз а гези, ше тефо4 аПо\/$ ю зоуе зетогтаН7еа ргоетл$ оЁ саегоптайоп упеп ш@г- 
табоп або поде! 1приб ап4 оириб 1$ по №1. 

Тье тефо4 4ое$ по гедииге а 1еагитх $азе. ТВе \уво]е с1аз$ а1рваБейс 1$ Гогте шт 
а ргосез$ оЁ то4е] зупе$1$ ап4 тау Бе сВапее4 оп апу 5(асе о? 4еуеортепе. 

Тье тефоа 1$ опелажей ю Фе обес ул а Шегагспу збгасвге (ргодисНоп зузетп$, 
сотрийп>® пебуогК$, огоап1зт апа {$ Гапсйопа| заб зу$етз ш а Неайтепе ргосез$ апа 
офег$). 

ТБе изе оР Воо]еап а[еебга рипстр!ез слуез мае роззИцу Гг апютайоп о деуе- 
1оршс саегоптайоп то4е[5. 
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